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右 删 失 数 据 下 Pareto 分 布 参数 的 经 验 Bayes 渐 近 性 质 * 


黄 娟 
(广东 海洋 大 学 理学 院 ， 淇 江 524088) 


摘 要 : 本 文 借助 经 验 Bayes 方法 研究 了 Pareto 分 布 参数 的 双边 检验 ， 由 于 此 方法 无 需 对 先 验 分 布 强加 
限制 ， 因 而 非常 稳健 。 在 随机 右 删 失 的 情形 下 ， 为 了 估计 未 知 的 边缘 密度 函数 及 其 导数 ， 首 先 引 
入 核 估计 方法 ， 从 而 ， 进 一 步 构造 了 参数 的 经 验 Bayes 检验 函数 ， 并 获得 了 所 提出 的 检验 函数 的 


渐 近 最 优 性 及 其 收敛 速度 。 
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1 引言 


从 1964 年 ，Robbinst 最 早 提出 了 经 验 Bayes 方 法 ， 随 后 一 些 学 者 ， 把 它 运 用 各 种 分 布 。 
经 验 Bayes (EB) 估计 和 检验 已 被 众多 统计 学 者 作 了 深入 的 研究 2-9， 但 是 ， 上 述 方法 基本 上 都 
是 在 完全 数据 情形 下 考虑 的 。 然 而 在 实际 生活 中 所 遇 到 的 样本 多 具有 不 完全 性 ， 如 : 在 可 靠 性 
寿命 试验 ， 医 药 追 踪 试验 及 其 生存 分 析 等 领域 的 研究 中 ， 产 生 了 大 量 的 不 完全 数据 ， 其 中 有 相 
当 一 部 分 数据 为 删 失 数据 。 本 文 在 右 删 失 数据 下 讨论 Pareto 分 布 参数 的 经 验 Bayes 检验 。 考 虑 
如 下 Pareto 分 布 回 ， 设 随机 变量 X 的 条 件 概率 密度 为 


0 0 
f(z10) = F (1) 


其 中 0 为 参数 ， 且 a 已 知 常 数 。 样 本 空间 为 Q = {fz|z > a}， 参 数 空间 为 @ = {010 > 0}. 
检验 如 下 的 问题 


Ho:0 < 8 < 0 4 M:6< 4h, 或 0 > 62, (2) 
此 处 91 和 0 为 给 定 的 正常 数 ， 若 取 
6 _ 4+ 82 _ 8-8) 
q= 2 , = 2 , 
则 检验 问题 (2) 可 转化 为 
Hg : |0 — o| < yo => HAT: |0 — bol > Yo. (3) 


对 假设 检验 (3)， 令 损失 函数 为 
Li(0, di) = (1 = i)a [ (0 E b0)? Ea % | Tlle—gol>Yol 


+a [?3 (6 = 90)? | 了 6-eol<>o}， i= 0, 1, 
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此 时 ，a 为 大 于 零 的 常数 ，d = {do,di} 是 行动 空间 ，do 表示 接受 HG, dı 表示 拒绝 HG» 
假设 参数 0 有 未 知 的 先 验 分 布 G(0)。 令 随机 化 判决 函数 为 


6(z) = P( 接 受 Hj |X ==), (4) 
则 6(z) 的 风险 函数 为 


R(5(z),G(O)) 


[ f [ Lo(0, do) f(x | 0)6(x) + L1 (0, di) f (xz10)(1 — 5(x)) |dadG(6) 
e Jn 


a J B(2)5(x)da + Co, (5) 
2 
此 处 
pe I L1(0,d1)dG(0), B(x) = i, [ (8 — 00)? — 2] f(a | @)aG(6). (6) 
(S) 9 
随机 变量 X 的 边缘 分 布 为 
也) 一 x = Ge (ett) 4 
f(x) 人 je16)dG(g) gba dG(0) (7) 
由 (6) 式 经 计算 可 得 
B(x) = W(2) f (x) + U(a) f (x) + Lf (a), (8) 
其 中 


W(x) =27, U(x) =(200+3)z, L= (0o +1}? -%, 


fO (x) 和 fO (x) 分 别 表示 f(x) 的 一 、 二 阶 导数 。 
由 (5) 可 知 ，Bayes 检验 函数 为 


| 1, A(z) <0, (0) 
0, B(x) > 0, 
H Bayes 风险 为 
R(G) = inf R(6,G) = R(ôc,G) = a f pb(z)ic(z)dz+Cc. (10) 


注意 到 当先 验 分 布 G(b) 已 知县 5(z) = 6G(z)， 上 述 风 险 是 可 求 的 。 然 而 G(9) 经 常 是 未 知 ， 
从 而 6c(z) 不 可 用 ， 因 此 引入 EB 方法 。 


2 EB 检验 函数 的 构造 


本 节 在 下 列 框架 下 构造 EB 检验 函数 : Be (Xi, 01), (Xo, 82), …，(Xn,bn) 为 独立 同 分 布 随 
机 变量 序列 ， 其 中 X, X2,.… Xn X AFL MIA EB f(x), X1,Xo,---, Xn AA 
REAR, X AGHPEA. 01,02, ,9%，9 是 不 可 观测 的 且 有 有 未 知 的 先 验 分 布 G(9)。 由 于 某 
种 原因 ， 历 史 样 本 {Xi;|1 < i < nn} 常 常 因 随机 右 删 失 而 不 能 被 完全 观察 到 ， 我 们 仅 能 观察 
BI {(Z;,6;)|1<i<n}, HP 


Z; = min (X;,Y;), 6:=1(X%;<Y;), i=1,2,---,n, 
1<i<n 


第 5 期 黄 娟 ， 右 删 失 数据 下 Pareto 分 布 参数 的 经 验 Bayes 渐 近 性 质 783 








A{Y%i|1 <i < 为 独立 同 分布 。 但 可 以 不 要 求 {Xi|1 <i < n} 与 {Yi|1 < i < n} 之 
间 相 互 独立 。 设 X 的 未 知 边缘 分 布 函数 为 (rz)， 其 未 知 边缘 密度 函数 和 7 阶 导数 分 别 
X f(x) & f(a) (7 = 0,1,2)。 于 是 利用 样本 


(21,61), (Z2, 62), em (Zn; ôn) 


来 估计 f(x) BF (x). 
对 Kaplan-Meimer 估计 量 作 些 修正 


A id Hn Zi bi(z) 
1- Pa = I (FT ) 


St A(x) = P(Z; < zx), Hax) 是 是 (z) 的 经 验 分 布 函数 ， 且 
Hy 二 1 一 Hp, 6;(x) 一 0 了 (Zi < z). 


进一步 假设 
Jim inf P(Y > X1| Xi) =d>0, 
EF rp = inf{t: F(t) = 1}。 并 假定 f(z) € Csa, z e R!， 其 中 Cs, 表示 R 中 的 一 族 概率 密 
度 函 数 ， 其 s 阶 导数 存在 ， 连 续 且 绝对 值 不 超过 a, s > 3 为 正 整数 。 首 先 构造 O(c) 的 佑 计量 。 
令 K,(x) (r = 0,1,2) 是 有 界 Bore 可 测 的 函数 ， 在 区 间 (0,1) 之 外 为 零 且 满足 如 下 条 件 


1 f? 1, t=r, 
(A1) af ut K,(u)du = 
t! 0 0, tH#r, #=0,1,---,s-1, 
1 
(A2) f Kildu < e< o, 
0 


H K! (u) X K, (u) 的 一 阶 导数 。 
记 f(a) = f(z), SORR f(z) Hr ER, Mr = 0,1,2. BM flO (x) 的 核 估计 为 


PA= gr | e = ah. an 
其 中 {bn} 为 正 数 序列 ， H lim bp = 0- 
所 以 B(x) 的 估计 量 为 
a(x) = W(a) SP (2) + Ua) f(a) + Lfal@) (12) 
故 EB 检验 函数 定义 为 
ne -f 1, Bn(z) < 0， aa 
0, Bnl) > 0. 


在 本 文中 ， 令 En 表示 对 随机 变量 {(2;,6;) |1 < i < n} 的 联合 分 布 求 均值 ， 则 bn(z) 的 全 面 
风险 为 
R(6n(x),G) = a | Bw)E, [5n(x)|da + Cg. (14) 
若 
Jim, R(6n, G) = R(dg,G), 
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称 {5n(x)} 为 浙 近 最 优 的 EB 检验 函数 ， 若 Rón G) - R(6G,G) = O(n), q > 0， 则 称 EB 检 


验 函数 {6n(z)} 的 收敛 速度 为 O(n-9)。 为 导出 {6%(zx)} 的 渐 近 最 优 性 和 收敛 速度 ， 首 先 证 明 以 
下 引 理 。 


3 引 理 


本 文中 令 c,c1, ca, ca,:… ,ce 表示 不 同 的 常数 ， 即 使 在 同一 表达 式 中 它们 也 可 取 不 同 的 值 。 
引 理 3.1 HfL 由 (11) 式 定义 ， 假 定 条 件 (41)-(42) ML, AL 


lim inf P(Y, > Xi|X1) =d>0, VxreEn. 
TTF 

D ， 当 Js)(z) 关 于 z 连 续 ， 当 
lim b,=0 H lm ntb”? loglogn = 0 


时 ， 则 有 
lim Bf (2) -Oo = 0. 


(Il) %4f(t)€ Coa Mb, =n BH, 对 于 0< 入 <1， 有 
B| f(a) — JOE) < cn 
(的 证 明 ”由 分 部 积分 可 得 
[AP (2) — FO @)]? 
= {gar | e(o- ar | e(o 
tar jK (二 
= a(r | K Ca 
+f he P E 
a(r 


2{ sas = Pe) -ro (F y +r e ro- 


< af he J Po- roK Ea h eoe- so) 











A — fa)" 


O-gr | (ar OF 


ee PaF 


A 








afo- Fy +f rr [RG K,( = *)aF(t) - Pay 














2{ oe sup |F(t) 一 F(t)| y GOlao 十 2( 寺 /GyG — ubn)du 一 PaF 


Ird (15) 
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利用 
lim inf P(Y; > X1| Xi) =d>0 
TTF 


及 条 件 (42)， 由 文献 [6] 可 得 
cloglogn 


ER < ; 
1 = nbert+? 


(16) 





将 f(z — ubn) Œ x 处 作 Taylor 展 开 有 
fla — uba) ~ fla) = EE onu) + E onu) 


(8-1) (> (8) (q* 





s! 
此 处 z* € (x — ubn, 2) o 
又 由 条 件 (41) 及 f(r) 的 连续 性 可 得 


1 8-1 p(k) (8) (q* 2 
B= {È | Klo + EO u) + 22) (o,u'] au -O 
n k=1 i : 


S 


f(x") 


a! 


= Ef xy) iua} = EE S a 


(—byu)fdu— fO) }" 





1 (r) 1 
af = f KW OO (bw)rdut = f Kii 





(s) 
= 24200-0526) + obn)? O(a), (17) 


HH (15) 2 (17), %4 
log log n 


pn 一 0 
”2 





一 0, 


则 
lim E| (2) - OE] =0. 


(II) 的 证 明 ”由 和 矩 不 等 式 可 得 ， 对 0 < 入 入 I 有 
E |P (E) — FO) < (EIP æ) - Ow). 
完全 类 似 (I) HERTA, H bn =n = 及 f(z) e Cs。 时 ， 易 得 


E| FPE) -OD < on R, 





512 3.2!71 $ R(ôc, G) R(n, G) AIH (10) M (14) RAH, W 


0 < R(ôn, G) — R(5c,G) <a f lele)lp(leslz) - B(a)| > IB(z)|)az. 
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4 ”EB 检验 函数 的 渐 近 性 质 
定理 4.1 设 bn(z) 由 (13) 式 定义 ， 假 定 条 件 (41)-(42) 成 立 ， 且 
Jim inf P(Y; > X,|X1) =d>0, 


其 中 rr = inf{t: F(t)=1}. # 
(A3) {bn} 为 正 数 序列 ， 且 满足 


lim b, =0, lim n71'07® loglogn = 0, 
也 一 Oo n= 
(44) | 02dG(0) <œ, (A5) 2)(z) 为 z 的 连续 函数 ， 
8 


证 明 记 
Yn (£) = |B(z)|p (1Bn(x) — B(z)| > B(2)|), 


WWW, (x) < |8(z)|。 
又 由 (6) 式 和 Fubini 定理 得 


i |B(a)|dax < [62 — 72| + / b2dG(b) + 218o] f 6dG(8) < o0. 
2 e 日 
由 引 理 3.2 得 
0< R(ôn, G) — R(Sc,G) <a f IB(z)lp (16%(z) — B(z)| > |B(e)| )de, 
故 由 控制 收敛 定理 可 知 


0< lim R(5n,G) — R(ig,G) < [lim &,,(z)}dz, 
n= 2 人 一 OO 
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(18) 


所 以 要 使 定理 4.1 成 立 ， 要 证 明 lim WV, (2) =0 对 a.s.z 成 立即 可 ， 由 Markov All Jensen 不 等 


式 可 得 
Wale) < U(E) [EIP (2) - JC)(z)P2] 
+W (2) [EIP (e) — FV] +L [Elfa(e) - F@P]?. 
再 由 引 理 3.1 (1) 和 引 理 3.2 可 知 ， 对 任意 固定 的 ze Q， 当 7 = 0,1,2 和 入 = 1， 有 


0 < lim ¥,(2) 


< [ Jim WEEP- wR] 


HV@) [ tim EPE) -OOP] + | im Elaa- P] =0, (19) 


n—-0Co 


将 (19) 式 代 入 (18) 式 ， 定 理 得 证 。 
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定理 4.2 设 刀 (z) 由 (13) 式 定义 ， 假 定 条 件 (41)-(42) 成 立 ， 且 
lim inf P(Y, > X1|X1) =d>0, 
HP rp = inf{t: F(t) =1}, H f£) E€ Cea HO<AS1, A 
(A6) / ZI™ NBT) dr < œ, m=0,1,2, 
2 
则 当 b =n aF 时， 有 
R(5n,G) ~ R(Sc,G) = O(n #2), 


其 中 s > 3 为 正 整数 。 
证 明 由 引 理 3.2 和 Markov 不等式 得 


0< R(in,G) — R(5a,G) < a J BE) UE) PB | f2 (a) - fO (2) dz 


$6; f BE) WP EID) - fG)(zjl>dz 


+03 f A(z) ILE | fale) — f(2)| "dz 


= Da + Ent Fh. (20) 
由 引 理 3.1 和 条 件 (46) 知 
Dn < cn 一 党 入 [> |B(a)|) Adz < can FS, (21) 
En < con EFS fe (B(x) |! da < can aE, (22) 
Fan < cgn 243 人 |6(z)| 一 ^dz < cm 一 人 在. (23) 


将 式 (21)-(23) 代入 式 (20)， 得 
R(5n, G) ~ R(6c,G) = O(n )， 
定理 得 证 。 O 
注 4X 3 1, Hs > co 时 ，O- 尝 香 ) 可 任意 接近 OUn- 雪 ， 即 经 验 Bayes 检 验 函 
Sn (x) 的 最 优 收敛 速度 为 O(n-3)。 
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Asymptotical Property of an Empirical Bayes Test for the Parameter 
of Pareto Distribution under Right Censored Data 


HUANG Juan 


(College of Science, Guangdong Ocean University, Zhanjiang 524088) 


Abstract: In this paper, we study the two-sided test of Pareto distribution by the empirical Bayes 
approach. Nonparametric empirical Bayes is more robust since it imposes no restriction on the prior. In 
order to estimate an unknown marginal density and its derivative, a kernel method is firstly introduced. 
Then the test rule for the parameter of Pareto distribution is constructed in case of randomly censored 
from the right. The asymptotically optimal property and convergence rates for the proposed EB test 
are derived. 
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